ایجاد روش هایی برای اندیس گذاری, جستجو و رتبه بندی صفحات برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
- author صادق خوارزمی
- adviser حسن ابوالحسنی احمد فراهی
- publication year 1388
abstract
با توجه به رشد روزافزون اطلاعات و دانش, حجم¬های بسیار بالا از این اطلاعات و دانش¬ها موجود می باشد که جستجو برای یافتن اطلاعاتی خاص در آن¬ها, به دلیل حجم¬های بالای آنها دیگر کار آسانی نمی¬باشد. همواره نیاز به سیستم¬هایی که بتواند اطلاعات مورد نیاز افراد را فراهم کند احساس ¬شده است. چالش¬های فنی در مسیر طراحی این گونه سیستم¬ها را می¬توان در دسته¬های کلی تقسیم¬بندی کرد. می¬توان به نحوه ذخیره سازی و بازیابی و همچنین نحوه ارتباط با کاربر, به عنوان دو مسئله مهم در طراحی این گونه سیستم¬ها اشاره کرد که هر کدام شامل مسائل زیادی نظیر شاخص¬گذاری, ذخیره-سازی, پردازش و ... است. در بسیاری از موارد تعامل خوبی بین کاربران و موتور های جستجوی وب برقرار نمی¬شود. دلیل اصلی این موضوع عدم استفاده از زبان مناسب و قابل فهم موتور جستجو توسط کاربر و همچنین عدم توانایی کاربر در بیان نیاز های خود است. یکی از راه¬کارهای حل این مشکل استفاده از تکنولوژی معنایی است که امکان استفاده از مفاهیم و ارتباطات آنها را نیز به سیستم می¬دهد . استفاده از این تکنولوژی نیز چالش¬هایی را به همراه دارد. از مشکلات این کار ارتباط مفاهیم با همدیگر و در نظر گفتن آنها در سامانه , عدم وجود ساختمان داده متناسب با این تکنولوژی , نحوه نمایش نتایج بر اساس ارتباطات معنایی و زبانی است که کاربر بتواند نیاز ها خود را با استفاده از آن زبان به خوبی بیان کند. همزمان با بکار¬گیری تکنولوژی معنایی سعی گردیده تا حدودی زبان مورد استفاده کاربر به عنوان زبان پرس و جو وهمچنین مفاهیم کلمات به زبان طبیعی کاربر نزدیک باشد. این تحقیق نیز در جهت مطالعه برای ایجاد موتور جستجویی با استفاده از تکنولوژی معنایی در حوزه صفحات فارسی ict می باشد. در این پروژه با توجه به امکانات موجود سعی در طراحی اولیه یک موتور جستجوی معنایی با استفاده از ساخت یک هستان شناسی بوده است. تمرکز بر روی ایجاد یک ساختمان داده و همجنین استفاده بهینه و انجام جستجوی معنایی با استفاده از این ساختمان داده است.
similar resources
ایجاد خزشگر تاکیدی و هست شناسی برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
گسترش بیش از حد وب، نیاز بر سامانه های بازیابی اطلاعات را بیش از پیش نموده است. یکی از این دست سامانه ها، که تحقیقات بسیاری را معطوف خود نموده است، موتور های جستجو هستند. رشد نماییِ استفاده از موتور های جستجو در میان کاربران وب به اندازه ای است که بسیاری حتی در انجام کار های روزمره، استفاد از آن را در اولویت قرار می دهند. این میزان رشد نمایان گر نیاز بر تمرکز بیش از پیش بر توسعه موتور های جستجوی...
بهینهسازی هستههای چندگانه در ماشینبردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریبآمیز
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخصگذاری آنها، قابلیت جستجوی سریع اطلاعات را به کاربران میدهند. یکی از چالشهای مهم در استفاده از این ابزار، صفحاتی هستند که از آنها بهعنوان صفحات فریبآمیز نام برده میشود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که میتوان به روشهایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از رو...
full textبررسی عناصر ابرداده ای موجود در صفحات وب حاصل از جستجو در موتورهای جستجوی عمومی
در پژوهش حاضر 90 صفحه وب از طریق جستجو در موتورهای جستجوی عمومی (گوگل، یاهو، و ام اس ان) به عنوان نمونه انتخاب شدند و میزان حضور عناصر ابرداده ای (هسته دابلین و ابرنشانه های زبان نشانه گذاری فرامتن) در این صفحات و وجود رابطه معنادار بین حضور عناصر ابرداده ای و نوع موتور جستجو مورد بررسی قرار گرفت. نتایج، نشان دهنده حضور بسیار کم عناصر ابرداده ای هسته دابلین و ابرنشانه های زبان نشانه گذاری فرامت...
full textرتبه بندی کیفی موتورهای کاوش فارسی و غیر فارسی در بازیابی اطلاعات حوزه اسلام
هدف: هدف پژوهش حاضر تعیین رتبۀ کیفیِ محتوای صفحات وب بازیابیشده از موتورهای کاوش فارسی و غیرفارسی در حوزه اسلام است. روششناسی: این پژوهش از نظر هدف کاربردی است و به روش پیمایشی _ توصیفی انجام شده است. ابزار گردآوری دادهها، سیاهۀ ارزیابی محققساخته با چهار معیار و متشکل از گویههای عمومی و تخصصی است. روایی ابزار با نظر ...
full textدسته بندی صفحات وب برای پالایش
مسئل? حفاظت از اقشار آسیب پذیر جامعه در مقابل موارد ناهنجار در صفحات وب، موجب احساس نیاز به پالایش صفحات وب شده است. یکی از جنبه های پالایش صفحات وب که امروزه بیش از پیش مورد توجه قرار گرفته است، طبقه بندی صفحات بر اساس میزان خشونت آمیز بودن آن ها است. طبقه بندی در واقع نسبت دادن یک صفحه به یک یا چند موضوع از پیش تعیین شده با استفاده از الگوهای آموزش داده شده می باشد. سیستم با استفاده از یک سری...
15 صفحه اولMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023